طراحی و کاربرد روش سنجش انطباقی کامپیوتری برای اجرای آزمون تولیمو در سازمان سنجش آموزش کشور

author

  • مریم مقدسین استادیار گروه روان‌شناسی بالینی، دانشکده‌ روان‌شناسی و علوم تربیتی، دانشگاه خوارزمی، تهران، ایران
Abstract:

سنجش مهارت زبان انگلیسی در ارزیابی‌های خطیر به تعداد زیادی پرسش برای آزمون‌هایی به‌شیوه‌ مداد-کاغذی (P&P) نیاز دارد؛ زیرا هر سال افراد بسیاری در این نوع آزمون‌های سرنوشت‌ساز شرکت می‌کنند. هدف از اجرای این پژوهش، طراحی و کاربرد سنجش انطباقی کامپیوتری (CAT) به‌عنوان گزینه‌ای برای سنجش مهارت زبان انگلیسی در سازمان سنجش آموزش کشور بود. CAT برخلاف آزمون‌های سنتی P&P که توالی گزینش پرسش‌ها در آن ثابت و یکنواخت است، از یک شیوه‌ گزینش سؤال بهینه و انطباقی استفاده می‌کند. CAT، برآورد توانایی موقت را به‌طور بهینه مورد هدف قرار می‌دهد و به یک ملاک همگرایی مناسب برای برآورد توانایی می‌رسد و در نتیجه، به یک فرایند سنجش کوتاه‌تر، قابل اطمینان‌تر و کارآمدتر می‌رسد. مورد مطالعه مهارت زبان انگلیسی در مطالعه حاضر، آزمون تولیمو است. این پژوهش در دو مرحله اجرا شده است: در مرحله اول، نمونه‌ای از اجراهای مداد-کاغذی آزمون تولیمو (دوره‌ 114 تا 123)، انتخاب و سپس، سؤال‌ها و توانایی آزمودنی‌ها مدرج‌سازی شد. در مرحله‌ دوم، CATهای بهینه شبیه‌سازی شده به‌عنوان مبنایی برای ارزیابی صحت و کارایی CAT عملیاتی طراحی شدند. نتایج پژوهش نشان داد که برآورد پارامتر توانایی به روش بیشینه‌ درست‌نمایی و ملاک توقف طول ثابت، بیشترین دقت در برآورد پارامتر توانایی آزمودنی‌ها را ایجاد می‌کنند. همچنین، آزمون CAT تولیمو که بر اساس خزانه‌ سؤال بهینه شبیه‌سازی‌شدند، نسبت به CAT عملیاتی که بر اساس خزانه‌ سؤال موجود طراحی شده‌ است، به سؤال‌های کمتری نیاز دارد، درحالی‌که به نتایج دقیق‌تری نسبت به CAT عملیاتی در برآورد پارامتر توانایی منجر می‌شود. بنابراین، باوجود مناسب بودن سؤال‌های موجود در خزانه‌ سؤال مدرج‌سازی شده آزمون تولیمو، طراحی سؤال‌هایی برای هدف اجرای آزمون به شیوه‌ CAT، هم به‌صرفه‌تر است و هم دقیق‌تر پارامتر توانایی را برآورد می‌کند. همچنین، نتایج این مطالعه نشان داد که آزمون تولیمو هم به شیوه‌ CAT شبیه‌سازی شده و CAT عملیاتی طراحی ‌شده به شکلی کارآتر و دقیق‌تر نسبت به تولیمو مداد-کاغذی عمل می‌کند. یافته‌های این پژوهش، نشان می‌دهد که آزمون CAT تولیمو دارای پتانسیل بالایی در کارایی و دقت اندازه‌گیری توانایی زبان انگلیسی است.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

طراحی خزانه‌های سؤال بهینه برای سنجش انطباقی کامپیوتری با در نظر گرفتن امنیت آزمون

سنجش انطباقی کامپیوتری به خزانه‌ سؤالی نیاز دارد که به ‌خوبی طراحی شده و برای ساخت آزمون‌های مجزا، تعداد مناسبی  سؤال‌ داشته باشد. همچنین شامل سؤال‌هایی باشد که از لحاظ محتوایی متعادل باشد و هزینه‌ ساخت آزمون را کاهش دهد. یکی از روش‌های طراحی خزانه‌ سؤال، روش رِکیس است، که در آن از روش مونت‌کارلو برای تعیین ویژگی‌های یک خزانه‌ سؤال بهینه استفاده می‌شود. در این پژوهش، از این روش برای طراحی خزانه‌...

full text

روش بهینه هموارسازی داده‌ها در همترازسازی: مورد مطالعه آزمون تولیمو و آزمون‌های جامع کنکورهای آزمایشی سازمان سنجش آموزش کشور

این پژوهش با هدف یافتن بهترین روش هموارسازی داده ها در روشهای مختلف همترازسازی انجام شد. به این منظور از داده‌های آزمون تولیمو و آزمونهای جامع کنکورهای آزمایشی شرکت تعاونی سازمان سنجش آموزش کشوردر سال 92-91 استفاده شد. برای تحلیل داده‌های آزمونهای جامع کنکورهای آزمایشی شرکت تعاونی سازمان سنجش آموزش کشور صرفاً از سؤالات مشترک دروس عمومی رشته‌های ریاضی- فیزیک، علوم تجربی و علوم انسانی استفاده شد. ...

full text

تعیین روش بهینه شناسایی کارکرد افتراقی در سنجش انطباقی کامپیوتری

زمینه: یکی از چالش‌های اساسی گذر از آزمون‌های مداد – کاغذی به انطباقی کامپیوتری عادلانه بودن است که ارزیابی آن در چارچوب کارکرد افتراقی ضرورتی اجتناب‌ناپذیر می‌باشد. هدف: هدف مطالعه حاضر بررسی کارکرد افتراقی، ارزیابی عوامل مداخله‌گر در میزان آشکارسازی و معرفی روش بهینه مطالعه کارکرد افتراقی در سنجش انطباقی کامپیوتری بود. روش: با توجه به مسئله پژوهش از روش تجربی استفاده شد. گردآوری داده‌ها و دست...

full text

تلفیق رویکرد ریکیسی و رویکرد برنامه‌نویسی ریاضی در طراحی خزانه‌های سؤال بهینه برای سنجش انطباقی کامپیوتری

سنجش انطباقی کامپیوتری (CAT) شیوه‌ای از سنجش توانایی است که دقت برآورد توانایی را افزایش می‌دهد و بدون از دست دادن دقت اندازه‌گیری آزمون، طول آن را کاهش می‌دهد. با این وجود، سنجش انطباقی در صورتی خوب عمل می‌کند که، دارای خزانه سؤالی باشد که در آن تعداد کافی سؤال با کیفیت مناسب وجود داشته باشد. بسیاری از محققان خاطر نشان کردند که، برای ساخت خزانه سؤالی برای (CAT)، نه ‌تنها اندازه خزانه سؤال مهم ...

full text

روش بهینه همترازسازی با توجه به ویژگی های بومی آزمونهای ملی ایران: مورد مطالعه آزمون تولیمو و آزمون های جامع کنکورهای آزمایشی سازمان سنجش آموزش کشور

هدف از انجام پژوهش حاضر ارزیابی روشهای همترازسازی نمره مشاهده شده کلاسیک و روش کرنل ke بر حسب خطاها و سوگیری و همچنین بررسی عواملی بود که می تواند بر صحت روشهای همترازسازی متفاوت تأثیر داشته باشد. این پژوهش به طور دقیق تر با هدف بررسی و کاوش سودمندی و مناسب بودن روش ke (با شیوه های مختلف هموارسازیchain و poststratification) و همچنین مزایا و معایب این روش در مقایسه با تکنیک های همترازسازی کلاسیک...

15 صفحه اول

تعیین مقایسه‌پذیری برآورد پارامتر توانایی در سنجش انطباقی کامپیوتری و مداد-کاغذی

هدف مطالعه حاضر تعیین مقایسه‌پذیری برآورد پارامتر توانایی در سنجش انطباقی کامپیوتری و مداد – کاغذی و تعیین الگوریتم بهینه آزمون انطباقی کامپیوتری بر اساس روش‌های مختلف برآورد توانایی (بیشینه درست‌نمایی و پسین مورد انتظار) و ملاک خاتمه آزمون (خطای استاندارد ثابت و طول ثابت آزمون) در آزمون‌های خطیر بود. جامعه پژوهش شامل تمامی شرکت‌کنندگان آزمون سراسری گروه آزمایشی علوم ریاضی و فنی سال 1392 بود که...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 10  issue 29

pages  61- 144

publication date 2020-05-21

By following a journal you will be notified via email when a new issue of this journal is published.

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023